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Streszczenie 

W artykule przedstawiono nowy algorytm kodowania stanów wewnętrz¬ 
nych automatu skończonego. Głównym zadaniem przedstawionego algo¬ 
rytmu jest minimalizacja poboru mocy w synchronicznych układach 
sekwencyjnych. Algorytm opiera się na tworzeniu drzewa binarnego, 
którego węzły powstają na wskutek podziału automatu skończonego. 
Wysokość drzewa równa jest liczbie bitów słowa kodowego. Wyniki 
eksperymentów wskazują, że proponowany algorytm prowadzi do zmniej¬ 
szenia poboru mocy, jak również zmniejszenia powierzchni układu 
w porównaniu do algorytmów kodowania już opracowanych. 

Słowa kluczowe: kodowanie stanów, pobór mocy, automat skończony. 

Finite state machinę state assignment 
algorithm for Iow power dissipation 

Abstract 

Power consumption has become one of the main issues during the design 
of embedded systems and VLSI circuits in the recent years, due to the 
continuous increase in the integration level and the operating freąuency. 
The largest fraction of power consumption in CMOS circuits is caused by 
signal switches. This paper presents a new algorithm for FSM encoding. 
The main task of the presented algorithm is to minimise power consumption 
in synchronous seąuential circuits. The algorithm is based on creating 
a binary tree whose nodes are created by sharing a finite state automaton. 
The tree height is eąual to the number of bits of codę words. The algorithm 
uses the FSM probabilistic model to obtain state encoding that minimise 
the number of signal transitions. The algorithm has been applied to the 
MCNC benchmark circuits and has also been compared with other encoding 
approaches. The experiment results show that the proposed algorithm 
reduces the power consumption, as well as the Circuit area compared to the 
state encoding algorithms already developed. 

Keywords: state assignment, power dissipation, finite state machinę. 

1. Wprowadzenie 

Synteza układów ukierunkowana na redukcję poboru mocy za¬ 
czyna obecnie odgrywać coraz większą rolę. Minimalizacja poboru 
mocy jest szczególnie istotna w układach mobilnych, zasilanych 


bateryjnie oraz układach pracujących z dużymi częstotliwościami. 
Nie bez znaczenia jest również ekologiczny aspekt niniejszego 
zagadnienia. Większość obecnie produkowanych układów cyfro¬ 
wych wykonywanych jest w technologii CMOS. Pobór mocy 
w tego typu układach jest sumą statycznego oraz dynamicznego 
poboru mocy. Pierwszy ze składników związany jest z prądami 
upływu płynącymi w stanie ustalonym, natomiast drugi z przeła¬ 
dowywaniem pojemności obciążenia w momencie przełączania. 
Dominującym składnikiem jest drugi z wymienionych, który może 
być minimalizowany w procesie syntezy logicznej. 

Średnia moc pobierana przez układy CMOS jest proporcjonalna 
do średniej aktywności przełączeń [1], Prawdopodobieństwo przełą¬ 
czenia i -tego wyjścia />, definiuje się jako liczbę zmian stanu logicz¬ 
nego na wyjściu i-tej bramki («„•) przypadającą na okres T [2]: 

Pi = lim . (1) 

Średnia moc dynamiczna wydzielana w układach CMOS, przy¬ 
padająca na okres T wynosi [3]: 

V 2 ^ 

P< = T C ,P, > ( 2 ) 

gdzie: V DD - napięcie zasilania, C, - pojemność obciążenia i-tej 
bramki, n - liczba bramek w układzie. 

Istota minimalizacji strat mocy w układach CMOS, uzyskiwana 
w procesie syntezy logicznej polega na minimalizacji liczby zmian 
stanów logicznych w układzie. W przypadku sekwencyjnych 
układów synchronicznych można to osiągnąć poprzez odpowied¬ 
nie kodowanie stanów wewnętrznych. 

Celem artykułu jest przedstawienie oryginalnego algorytmu ko¬ 
dowania stanów wewnętrznych automatów sekwencyjnych ukie¬ 
runkowanego na minimalizację poboru mocy. Istota zapropono¬ 
wanego algorytmu sprowadza się do znalezienia takiego skojarze¬ 
nia słów kodowych z symbolicznie opisanymi stanami, które 
zapewni podczas występujących w automacie przejść, jak naj¬ 
mniejszą liczbę przełączeń przerzutników. 

2. Podstawy teoretyczne, przegląd rozwiązań 

Model matematyczny układu sekwencyjnego stanowi automat 
skończony FSM (ang. Finite State Machinę). Istotnym elementem 
syntezy automatów sekwencyjnych jest proces kodowania stanów 
wewnętrznych. Polega on na przyporządkowaniu każdemu stano¬ 
wi wewnętrznemu automatu unikatowej reprezentacji binarnej. 

Automaty skończone można opisać za pomocą dyskretnych łań¬ 
cuchów Markowa. Dla podanego prawdopodobieństwa pojawienia 
się danych stanów logicznych na wejściach automatu, można wy¬ 
znaczyć prawdopodobieństwo poszczególnych przejść w automacie. 
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Prawdopodobieństwo statyczne, czyli prawdopodobieństwo znale¬ 
zienia się automatu w określonym stanie po nieskończenie długim 
czasie, można obliczyć korzystając z równania Chapmana- 
Kołmogorowa [4], Pozwala to na probabilistyczny opis automatu, 
w którym krawędziom nieskierowanego grafu łączącym odpowied¬ 
nie stany, przyporządkowuje się wagi poszczególnych przejść. 

Istota minimalizacji mocy polega na takim kodowaniu, aby sta¬ 
nom połączonym krawędziami o największych wagach, przypo¬ 
rządkować kody, których odległość Hamminga jest równa jeden. 
Idealnie byłoby wówczas, gdyby wszystkie stany połączone kra¬ 
wędziami miały kody, których odległość Hamminga jest równa 
jeden. Niestety z uwagi na ograniczenie liczności zbioru kodów, 
ten warunek z reguły nie może zostać spełniony, szczególnie 
w przypadku automatów, które posiadają "gęste" grafy. Problem 
kodowania można zatem sprowadzić do zadania programowania 
całkowitoliczbowego. Jednak dokładne rozwiązanie tego zadania 
może być niewykonalne. Dlatego stosuje się metody heurystyczne. 

W literaturze przedmiotu znane są różnorodne algorytmy ko¬ 
dowania ukierunkowane na minimalizację poboru mocy. W pracy 
[3] przedstawiono algorytm POW3 nazywany również kolumno¬ 
wym. Automat jest kodowany "bit po bicie" przy przestrzeganiu 
liczności poszczególnych klas nierozróżnialności. W [5] zapropo¬ 
nowano wykorzystanie kodowania Huffmana. Znany jest również 
algorytm wykorzystujący drzewo rozpinające [6], Z kolei w pracy 
[7] zastosowano algorytm wyżarzania. Stosowane są również 
algorytmy genetyczne [8], W [9] zaproponowano kilka różnych 
metod kodowania: Depth First, Min Distance, One Level, One 
Level Tree, Back Tracking. Metody te składają się z dwóch eta¬ 
pów. Pierwszy polega na odpowiednim sortowaniu stanów, drugi - 
na przypisywaniu stanom słów kodowych z uwzględnieniem 
funkcji określającej moc i przydzielone uprzednio kody. W pracy 
[10] przedstawiono dwa algorytmy: iteracyjny oraz sekwencyjny. 
Algorytm iteracyjny pozwala na poprawienie wyników kodowania 
przeprowadzonego za pomocą innego, dowolnego algorytmu. 
W algorytmie sekwencyjnym kodowanie uzależnione jest od 
przypisanych uprzednio kodów. 

W większości znanych z literatury rozwiązań, proces kodowa¬ 
nia stanów odbywa się zgodnie z zasadą "słowo po słowie", 
w którym kojarzenie słów kodowych z symbolicznymi warto¬ 
ściami odbywa się po uprzednim uporządkowaniu stanów zgodnie 
z jakimś założonym kryterium. W zaproponowanej metodzie 
kodowania, nie występuje etap kojarzenia słów kodowych z upo¬ 
rządkowanymi uprzednio, symbolicznie opisanymi stanami. Istota 
kodowania sprowadza się do podziałów wszystkich stanów na 
podzbiory, którym przyporządkowuje się kolejno poszczególne 
bity kodu. Tego typu "dekompozycyjne" kodowanie stanów, 
w którym kodowanie odbywa się zgodnie z zasadą "bit po bicie", 
zachowuje elastyczność przyporządkowywania słów kodowych od 
początku do końca procesu kodowania. 

3. Kodowanie stanów wewnętrznych 
automatu ukierunkowane na 
minimalizację poboru mocy 

Opracowany "dekompozycyjny" algorytm kodowania zostanie 
przedstawiony na przykładzie kodowania stanów wewnętrznych 
jednego z automatów testowych MCNC [11]. Wybrano automat 
dk27, którego graf przedstawiono na rys. 1. 



Rys. 1. Graf automatu dk27 
Fig. 1. Graph of dk27 

Macierz prawdopodobieństwa przejść, wynikająca z sygnałów 
wejściowych, przy założeniu, że prawdopodobieństwo wystąpie¬ 


nia jedynki i zera na wejściu jest takie samo (p(0)=p(l)=0,5) ma 
postać: 
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( 3 ) 


Na postawie powyższej macierzy wyznacza się wektor prawdo¬ 
podobieństwa statycznego: 

p s = [0,190 0,190 0,095 0,095 0,167 0,214 0,048 ]. (4) 


Kolejny krok, to wyznaczenie prawdopodobieństwa przejścia 
od stanu ć>, do stanu Sj pod warunkiem, że automat znajduje się 
w stanie ,S’„ zgodnie zależnością: 

P l iS,^S J ) = p s iS i )P(S il ), (5) 


co daje macierz: 
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Zmiana stanu automatu z S 

na Sj 

wymaga 

przełączenia takiej 


samej liczby przerzutników, co zmiana ze stanu Sj na Można 
zatem przekształcić graf skierowany w graf nieskierowany, które¬ 
go wagi poszczególnych krawędzi będą przyjmować wartość: 

=p,(S,. -»S,) + p,(S, ->S f ). (7) 

Graf nieskierowany automatu dk27 wraz z wyznaczonymi wa¬ 
gami poszczególnych krawędzi przedstawiono na rys. 2. 



Rys. 2. Graf automatu dk27 wraz z wagami krawędzi 
Fig. 2. Weighted graph of dk27 

Algorytm kodowania opiera się na tworzeniu drzewa binarnego, 
którego węzły powstają na wskutek podziału stanów automatu 
skończonego. Wysokość drzewa równa jest liczbie bitów słowa 
kodowego. Poszczególne węzły tworzone są następująco: 

- jeśli liczba stanów w węźle, który dzielimy jest większa niż dwa, to 
do nowo tworzonego węzła (lewy syn) są dodawane stany połączo¬ 
ne krawędzią o największej wadze, w przeciwnym przypadku są 
tworzone dwa nowe węzły o liczbie stanów równej jeden, 

- jeśli liczba wolnych stanów w dzielonym węźle przekracza mak¬ 
symalną liczbę stanów (8), to do aktualnego węzła dodawane są 
stany, których suma wag krawędzi pomiędzy stanami już należą¬ 
cymi do aktualnego węzła jest maksymalna, w przeciwnym przy¬ 
padku tworzony jest nowy węzeł (prawy syn), w skład którego 
wchodzą stany, które nie zostały przypisane do poprzednio tworzo¬ 
nego węzła (lewy syn). 
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Powyższe czynności są powtarzane aż wysokość drzewa binarne¬ 
go będzie równa liczbie bitów słowa kodowego. Maksymalna liczba 
stanów w poszczególnych węzłach M/ zależna jest od / - poziomu 
tworzonego węzła (poziom korzenia wynosi 0) i N — liczby bitów 
słowa kodowego, zgodnie z zależnością: 

M, <2 n “'. (8) 

Obecnie przedstawione zostanie kodowanie automatu testowego 
dk27. Najpierw, wyznacza się minimalną liczbę bitów potrzebną dla 
zakodowania siedmiu stanów N—3. Następnie tworzy się korzeń 
drzewa, w skład którego wchodzą wszystkie stany automatu. Na 
początku wybiera się dwa stany połączone krawędzią o największej 
wadze, czyli SI i S6. Po tej operacji liczba wolnych stanów wcho¬ 
dzących w skład korzenia wynosi 5. W przypadku tworzenia wę¬ 
złów pierwszego poziomu (1=1) maksymalna liczba wolnych sta¬ 
nów Mj równa jest 4, zatem należy dodać jeszcze jeden stan do 
tworzonego węzła drzewa (lewy syn). Wybrany zostaje stan S4, 
ponieważ suma wag krawędzi łączących ten stan ze stanami SI i S6 
jest maksymalna i wynosi 0,19. Pozostałe stany (S2,S3,S5,S7) 
zostają dodane do nowego węzła (prawy syn). Kolejne węzły drze¬ 
wa tworzone są sukcesywnie, aż do momentu, gdy wysokość drze¬ 
wa będzie równa liczbie bitów słowa kodowego N. Binarne drzewo 
kodowe automatu testowego dk27 przedstawione jest na rys. 3. 



Rys. 3. Binarne drzewo kodowania 
Fig. 3. Binary tree coding 

Zgodnie z otrzymanym drzewem poszczególne stany będą mia¬ 
ły następujące kody: sl-0, s2-l, s3-3, s4-6, s5-5, s6-4, s7-7. 

4. Wyniki badań eksperymentalnych 

Przedstawiony w rozdziale 3 algorytm został zaimplementowa¬ 
ny w języku C++. W celu obiektywnego porównania go z innymi 
metodami znanymi z literatury zaimplementowano również algo¬ 
rytm OLT (One Level Tree) [9]. Wybrano ten algorytm, ponieważ 
prowadzi do najlepszych rozwiązań pod względem poboru mocy. 
Do estymacji mocy wykorzystano pakiet SIS [12], Obliczenia 
mocy zostały wykonane dla: /=20MHz, F DD =5V. Do minimali¬ 
zacji części kombinacyjnej układu został wykorzystany skrypt 
script.rugged [12], W tabeli 1 przedstawiono wyniki syntezy 
sześciu wybranych automatów testowych. Poszczególne kolumny 
przedstawiają pobieraną moc ( P) oraz powierzchnię zajmowaną 
przez uzyskiwany układ (A). Porównano cztery algorytmy kodo¬ 
wania: algorytm "one-hot" (gorąca jedynka), algorytm zaimple¬ 
mentowany w module Yedi, znany z literatury algorytm OLT [9] 
oraz przestawiony w niniejszej publikacji algorytm dekompozy- 
cyjny (AD). W ostatnim wierszu tabeli 1 zawarto liczby określają¬ 
ce sumaryczną moc i całkowitą powierzchnię. 


Tab. 1. Wyniki badań eksperymentalnych, P-moc, A-powierzchnia 
Tab. 1. Experimental results, P-power, A-area 
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60 
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73 
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69 

train4 
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65 

88 

36 

80 

36 

84 

36 

suma 

2063 

1452 

1924 

940 

1770 

974 

1633 

944 


W przypadku pięciu automatów zaproponowany algorytm (AD) 
zapewnił uzyskanie najlepszych wyników. W porównaniu do popu¬ 
larnego i powszechnie stosowanego algorytmu "one hot", algorytm 
AD w każdym z przypadków doprowadził do redukcji poboru 
mocy. Dla automatu lion9 uzyskano zmniejszenie mocy aż o 64%. 
Kodując stany algorytmem Yedi, tylko dla automatu dkl5 osiągnię¬ 
to moc identyczną jak w proponowanej metodzie AD. Maksymalna 
różnica pomiędzy YEDI i AD pojawiła się dla automatu dk27 
i wynosiła 39%. Proponowany algorytm kodowania doprowadził 
również do lepszych wyników od algorytmu OLT. Sumaryczna moc 
dla wszystkich automatów była najmniejsza dla algorytmu AD. 

5. Podsumowanie 

W artykule przedstawiono nowy, dekompozycyjny algorytm 
kodowania stanów wewnętrznych automatu skończonego. Wyniki 
eksperymentów wskazują jednoznacznie, że prowadzi on do 
zmniejszenia poboru mocy w stosunku do popularnego algorytmu 
"one hot", ukierunkowanego na minimalizację powierzchni, bar¬ 
dzo wyrafinowanego i skutecznego algorytmu Yedi oraz znanego 
z bardzo efektywnych pod względem mocy algorytmu OLT. 
Oczywiście, w celu bardziej obiektywnego porównania algoryt¬ 
mów kodowania konieczne jest przeprowadzenie znacznie szer¬ 
szego wachlarza eksperymentów. W pierwszej kolejności zostaną 
jednak sprawdzone różne warianty kojarzenia wierzchołków 
drzewa binarnego z kolejnymi bitami słów kodowych, ponieważ 
widać duży wpływ tego procesu na ostateczne wyniki. Można 
więc liczyć, na uzyskanie jeszcze lepszych rezultatów. 

Podsumowując, warto zwrócić uwagę na dwie, bardzo korzyst¬ 
ne cechy przestawionego algorytmu kodowania. Po pierwsze, jest 
on niezwykle "szybkim" algorytmem. Dodatkowo prowadzi do 
efektywnych rozwiązań pod względem powierzchni. W porówna¬ 
niu do nastawionego na minimalizację powierzchni algorytmu 
Yedi, uzyskano sumaryczną redukcję mocy o 15,1%, przy wzro¬ 
ście powierzchni o 0,4%. 
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